4.2 Fisher的信任推断法

Fisher 的区间估计的方法原则上可以用于任何统计推断问题, 代表了对统计问题的一种根本上不同的观点.

1 信任分布

设样本 XN(θ,1), 样本大小为 1, 则 XθN(0,1), 即对 tR: P(Xθ<t)=Φ(t)=12πtey22dy, 它可以改写为 (1.1)P(θ>Xt)=Φ(t),P(θ<Xt)=1Φ(t). 虽然从通常的概率论来说这样的写法没什么区别, 但是 Fisher 却认为, 有了样本 X 后, 把 θ 看成一个随机变量, 它就有了一个分布, 把它称为 θ信任分布.

在得到 X 前, 我们对 θ 一无所知. X 提供的信息打破了我们的无知, 用概率分布的形式给出了对 θ 的新认识.

再比如, 要做 θ区间估计, 给定 α, 找 a,b(a<b), 使 P~(aθb)=1α (P~ 表示 θ 的信任分布). 则根据 (1.1), 这要求 Φ(Xa)Φ(Xb)=1α. 取一组让 ba 最小的 a,b, 这时 a=Xuα2, b=X+uα2.


对于多个样本 X1,,Xni.i.dN(θ,1), 注意到 Xθ充分统计量, 且 n(Xθ)N(0,1), 则得到信任分布 θN(X,1n). 由此建立信任区间 [Xuα2n,X+uα2n].
再比如 X1,,Xni.i.dN(a,σ2), a,σ 未知, 则 n(Xa)Stn1, 即 P(n(Xa)S<x)=Tn1(x)=P(a>XSxn).
虽然到目前为止和置信区间的结果一样, 但是往后人们发现具体结果也可能不同.
Fisher 的理论目前存在两个问题:

2 用 Fisher 方法解 Behrens-Fisher 问题

Behrens-Fisher 问题是这样的问题:

问题

X1,,XmN(a,σ12), Y1,,YnN(b,σ22), a,b,σ1,σ2 未知, 所有样本独立, 找 ba 的区间估计.

也即和前面的两样本检验相比, 最大的不同是方差不再相同.
为了解决这个问题, 记 X,S12,Y,S22. 记 t1tm1, t2tn1. 用 ξ=dη 表示两个随机变量分布相同. 则 m(Xa)S1=dt1,n(Yb)S2=dt2.Z=YX, θ=ba. 记 S1=S1m, S2=S2n, 则 Zθ=S2t2S1t1θ=Z(S2t2S1t1). 有了样本后, 记 Z,S1,S2 的具体值为 z,s1,s2. 则上式变为 θ 的信任分布.
因为 t1,t2 独立且都是 t 分布, 所以可以确定 θ 的信任分布. 记 r=s12+s22, 找 ψ:cosψ=s2r. 此时 sinψ=s1r. 而 s2t2s1t1=r(t2cosψt1sinψ). 用 Fm,n,ψ 表示 t2cosψt1sinψ 的分布(因为只和 m,n,ψ 有关). 找 ym,n,ψ,α>0 使得 Fm,n,ψ(ym,n,ψ,α)Fm,n,ψ(ym,n,ψ,α)=1α,P~(|zθ|rym,n,ψ,α)=P(|t2cosψt1sinψ|ym,n,ψ,α)=1α, 于是 P~(zrym,n,ψ,αθz+rym,n,ψ,α)=1α. 从而我们得到信任区间 [zrym,n,ψ,α,z+rym,n,ψ,α].
可以证明这个区间并不是 1α 置信区间.